Hiérarchisation des règles d'association en fouille de textes

نویسندگان

  • Rokia Bendaoud
  • Yannick Toussaint
  • Amedeo Napoli
چکیده

Résumé. L’extraction de règles d’association est souvent exploitée comme méthode de fouille de données. Cependant, une des limites de cette approche vient du très grand nombre de règles extraites et de la difficulté pour l’analyste à appréhender la totalité de ces règles. Nous proposons donc de pallier ce problème en structurant l’ensemble des règles d’association en hiérarchies. La structuration des règles se fait à deux niveaux. Un niveau global qui a pour objectif de construire une hiérarchie structurant les règles extraites des données. Nous définissons donc un premier type de subsomption entre règles issue de la subsomption dans les treillis de Galois. Le second niveau correspond à une analyse locale des règles et génère pour une règle donnée une hiérarchie de généralisation de cette règle qui repose sur des connaissances complémentaires exprimées dans un modèle terminologique. Ce niveau fait appel à un second type de subsomption inspiré de la subsomption en programmation logique inductive.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fouille de textes hiérarchisée appliquée à la détection de fautes

This paper presents an original text mining approach based on text segmented units, mixing data mining techniques and text linguistics. First, we describe the text units and their descriptors designed for detecting mistakes in scientific papers in English. These include text organisation, emphasizing the relative positions and the context of stylistic markers. Secondly, the paper explains the t...

متن کامل

Le rôle de l'utilisateur dans un processus d'extraction de règles d'association

Résumé. De nombreux travaux ont porté sur l'extraction de règles d'association. Cependant, cette tâche continue à intéresser les chercheurs en fouille de données car elle soulève encore plusieurs défis. En particulier, son utilisation en pratique reste difficile : d'une part, le nombre de règles apprises est souvent très grand, d'autre part, le traitement des valeurs numériques dans cette tâche...

متن کامل

Utilisation des réseaux bayésiens dans le cadre de l'extraction de règles d'association

Résumé. Cet article aborde le problème de l’utilisation d’un modèle de connaissance dans un contexte de fouille de données. L’approche méthodologique proposée montre l’intérêt de la mise en œuvre de réseaux bayésiens couplée à l’extraction de règles d’association dites delta-fortes (membre gauche minimal, fréquence minimale et niveau de confiance contrôlé). La découverte de règles potentielleme...

متن کامل

Règles d'association avec une prémisse composée : mesure du gain d'information

La communauté de fouille de données a développé un grand nombre d’indices permettant de mesurer la qualité des règles d’association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d’interpréter les règles simples, s’avèrent d’utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les ...

متن کامل

Extraction de règles d'association quantitatives - Application à des données médicales

Résumé. L’extraction de règles d’association est devenue aujourd’hui une tâche populaire en fouille de données. Cependant, l’algorithme Apriori et ses variantes restent dédiés aux bases de données renfermant des informations catégoriques. Nous proposons dans cet article QuantMiner, qui est un outil que nous avons développé dans le but d’extraire des règles d’association gérant variables catégor...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005